智能论文笔记

What to Prune and What Not to Prune at Initialization

Maham Haroon

分类：神经与进化计算 | 机器学习

2022-09-06

基于训练后辍学的方法实现了高稀疏性，并且是解释与计算成本和神经网络架构中过度拟合的问题的良好方法。相反，初始化修剪仍然远远落后。当涉及到网络的计算成本时，初始化修剪更有效。此外，它可以处理过度拟合以及培训后辍学。在对上述原因的认可中，本文提出了两种初始化时修剪的方法。目标是在保持性能的同时获得更高的稀疏性。 1）K-starts，从初始化时k随机p-sparse矩阵开始。在前几个时期，网络然后确定了这些P-Sparse矩阵的“优胜者”，以尝试找到“彩票” P-SPARSE网络。进化算法如何找到最好的个体来采用这种方法。根据神经网络体系结构，健身标准可以基于网络权重的大小，梯度积累的幅度或两者的组合。 2）耗散梯度方法，目的是消除在前几个时期内保持其初始值的一部分的权重。尽管它们的幅度最佳地保留了网络的性能，但以这种方式去除权重。相反，该方法还需要最多的时期才能达到更高的稀疏性。 3）耗散梯度和KSTART的组合始终优于方法和随机辍学。使用提供的相关方法的好处是：1）他们不需要对分类任务的特定知识，固定辍学阈值或正则化参数2）模型的重新训练既不是必要的，也不影响P-SPARSE网络的性能。

translated by 谷歌翻译

TF-Net: Deep Learning Empowered Tiny Feature Network for Night-time UAV Detection

Maham Misbah , Misha Urooj Khan , Zhaohui Yang , Zeeshan Kaleem

分类：计算机视觉

2022-11-29

Technological advancements have normalized the usage of unmanned aerial vehicles (UAVs) in every sector, spanning from military to commercial but they also pose serious security concerns due to their enhanced functionalities and easy access to private and highly secured areas. Several instances related to UAVs have raised security concerns, leading to UAV detection research studies. Visual techniques are widely adopted for UAV detection, but they perform poorly at night, in complex backgrounds, and in adverse weather conditions. Therefore, a robust night vision-based drone detection system is required to that could efficiently tackle this problem. Infrared cameras are increasingly used for nighttime surveillance due to their wide applications in night vision equipment. This paper uses a deep learning-based TinyFeatureNet (TF-Net), which is an improved version of YOLOv5s, to accurately detect UAVs during the night using infrared (IR) images. In the proposed TF-Net, we introduce architectural changes in the neck and backbone of the YOLOv5s. We also simulated four different YOLOv5 models (s,m,n,l) and proposed TF-Net for a fair comparison. The results showed better performance for the proposed TF-Net in terms of precision, IoU, GFLOPS, model size, and FPS compared to the YOLOv5s. TF-Net yielded the best results with 95.7\% precision, 84\% mAp, and 44.8\% $IoU$.

translated by 谷歌翻译

Learning Branched Fusion and Orthogonal Projection for Face-Voice Association

Muhammad Saad Saeed , Shah Nawaz , Muhammad Haris Khan , Sajid Javed , Muhammad Haroon Yousaf , Alessio Del Bue

分类：计算机视觉

2022-08-22

近年来，人们对建立面孔和名人声音之间的关联的兴趣越来越大，从而利用YouTube的视听信息。先前的工作采用公制学习方法来学习适合关联匹配和验证任务的嵌入式空间。尽管显示出一些进展，但由于依赖距离依赖的边缘参数，运行时训练的复杂性差以及对精心制作的负面采矿程序的依赖，这种制剂是限制性的。在这项工作中，我们假设一个丰富的表示形式以及有效但有效的监督对于实现面部voice关联任务的歧视性关节嵌入空间很重要。为此，我们提出了一种轻巧的插件机制，该机制利用这两种方式中的互补线索以通过正交性约束来根据其身份标签形成丰富的融合杂物并将其簇形成。我们将我们提出的机制作为融合和正交投影（FOP）创造，并在两个流网络中实例化。在Voxceleb1和Mav-Celeb数据集上评估了总体结果框架，其中包括许多任务，包括跨模式验证和匹配。结果表明，我们的方法对当前的最新方法有利，而我们提出的监督表述比当代方法所采用的方法更有效。此外，我们还利用跨模式验证和匹配任务来分析多种语言对面部声音协会的影响。代码可用：\ url {https://github.com/msaadsaeed/fop}

translated by 谷歌翻译

Fusion and Orthogonal Projection for Improved Face-Voice Association

Muhammad Saad Saeed , Muhammad Haris Khan , Shah Nawaz , Muhammad Haroon Yousaf , Alessio Del Bue

分类：计算机视觉

2021-12-20

我们研究了脸部和声音之间学习协会的问题，这是最近对计算机视觉界的兴趣。现有作品采用成对或三重态损耗配方，以学习适用于相关匹配和验证任务的嵌入空间。尽管展示了一些进展，但这种损失配方由于依赖差距利润率参数，运行时训练复杂性差，以及依赖于仔细制作的负挖掘程序而受到限制。在这项工作中，我们假设具有有效且有效的监督耦合的富集的特征表示是实现改进的面部语音关联的鉴别性关节嵌入空间。为此，我们提出了一种轻量级，即插即用机制，可利用两种方式的互补线程来形成丰富的融合嵌入并通过正交限制基于其身份标签进行群集。我们将我们提出的机制硬币作为融合和正交投影（FOP），并在两条流管道中实例化。在具有多种任务的大规模VOXECEB数据集上评估总体产生的框架，包括跨模型验证和匹配。结果表明，我们的方法对目前的最先进的方法进行了有利，我们拟议的监督制定比当代方法所采用的制定更有效和效率。

translated by 谷歌翻译

HARPO: Learning to Subvert Online Behavioral Advertising

Jiang Zhang , Konstantinos Psounis , Muhammad Haroon , Zubair Shafiq

分类：机器学习

2021-11-09

在线行为广告和相关的跟踪疗法，构成了真正的隐私威胁。不幸的是，现有的隐私增强工具并不总是对在线广告和跟踪有效的。我们提出了基于基于学习的基于学习的方法来通过混淆来颠覆在线行为广告。 Harpo使用强化学习来自适应地交织使用虚假页面的真实页面访问，以扭曲跟踪器的用户浏览配置文件的视图。我们评估Harpo反对用于在线行为广告的现实世界用户分析和广告目标模型。结果表明，Harpo通过触发超过40％的不正确的兴趣和6倍的出价值来提高隐私。 Harpo优于现有的混淆工具，在相同的开销中多达16倍。 Harpo还能够实现比现有的混淆工具更好地对抗对抗性检测。 Harpo有意义地推进利用混淆来颠覆在线行为广告

translated by 谷歌翻译

RAFT: A Real-World Few-Shot Text Classification Benchmark

Neel Alex , Eli Lifland , Lewis Tunstall , Abhishek Thakur , Pegah Maham , C. Jess Riedel , Emmie Hine , Carolyn Ashurst , Paul Sedille , Alexis Carlier

分类：自然语言处理 | 人工智能 | 机器学习

2021-09-28

大型预先训练的语言模型已经显示了几次拍摄学习的承诺，只提供了几个任务特定示例给出了基于文本的任务。款式将很快解决到目前为止为人类研究助理保留的分类任务吗？现有的基准标记不设计用于衡量应用设置的进度，因此不要直接回答这个问题。 RAFT基准（现实世界注释的少量拍摄任务）侧重于自然发生的任务，并使用镜像部署的评估设置。 RAFT的基线评估揭示了当前技术斗争的地区：推理在许多班级的长篇文章和任务上。人类基线表明，非专家人类难以反映出一些分类任务，反映了现实世界的价值有时依赖于域名专业知识。甚至非专业人类基线F1分数超过GPT-3平均为0.11。 RAFT DataSets和排行榜将跟踪哪些模型改进在https://raft.elict.org中转化为现实世界的优势。

translated by 谷歌翻译